查看原文
其他

《2023机器翻译技术及产业应用蓝皮书》权威发布

百度翻译 百度翻译 2023-06-15

近日,百度翻译联合中国外文局翻译院、中国翻译协会翻译技术委员会权威发布了《2023机器翻译技术及产业应用蓝皮书》。

《2023机器翻译技术及产业应用蓝皮书》
《蓝皮书》系统阐述了机器翻译的发展历程和方向,介绍了产业级机器翻译系统和产品形式,并通过实际案例展示了机器翻译产业应用现状,对机器翻译未来发展提出建议。
《蓝皮书》共分五章:第一章阐述了在国际传播能力建设及国家翻译能力建设中,使用以机器翻译为代表的翻译技术的必要性。习近平总书记多次在国际国内重要场合讲述翻译故事,充分肯定翻译工作对中国走向世界、世界读懂中国的积极贡献。机器翻译等翻译技术的发展对翻译行业起到了巨大推动作用,在许多场景应用中表现出强大能力和发展潜力。翻译行业各方应积极探索和推进人工智能、大数据、虚拟现实等技术在习近平新时代中国特色社会主义思想对外宣介、对外翻译出版中的应用。第二章系统介绍了机器翻译的发展历程、发展态势及面临的挑战。自1947年机器翻译的设想被提出以来,出现了基于规则的机器翻译、统计机器翻译及神经网络机器翻译三种机器翻译方式。目前,神经网络机器翻译是主流的机器翻译方式。受技术革新与社会发展等诸多因素影响,机器翻译逐渐呈现规模化、多领域化、多语言化及跨模态化的趋势,其应用场景不断扩大。在现阶段,机器翻译技术在译文质量、鲁棒性和容错能力、低资源语种翻译能力、多模态融合技术能力及标准建设等五方面仍需继续加强。第三章介绍了产业级机器翻译系统和产品形式。产业级机器翻译系统通常具有多领域、多语言、跨模态的全面翻译能力、基于飞轮效应的持续进化能力、核心技术自主研发能力及全生命周期安全保障能力等技术特征。在形成成熟的产品和应用前,面向产业的机器翻译系统应经过模型训练、部署发布等环节,同时应始终保证数据和系统安全。机器翻译产品有三种划分方式,即按照模态划分、按照载体划分及按照系统部署划分。按照模态划分,主要有文本翻译、语音翻译、图像翻译等;按照载体划分,主要有电脑端、移动端以及多种形式的智能硬件产品;按照系统部署划分,主要有在线部署和离线部署。第四章通过实际应用案例展示了现阶段机器翻译产业现状。目前,机器翻译的产业应用呈现出高质量、多语言、跨模态、定制化等特点。《蓝皮书》通过列举机构与企业使用机器翻译的实例,阐述了机器翻译在赋能企业全球化发展、助力行业数字化建设、助力中华文化“走出去”及赋能跨语言国际交流等方面发挥的积极作用。第五章展望机器翻译的发展趋势,并对机器翻译未来发展提出建议。在新技术发展浪潮下,机器翻译将在跨语言理解及生成能力提升、低资源语言翻译能力加强、机器翻译系统的灵活性及智能交互能力提升以及机器翻译应用场景和领域拓展等方面取得新突破。为推动机器翻译产业良性发展,应尽快建设我国自主研发的机器翻译系统,加快高质量、大规模语料库搭建,加强翻译技术标准建设,加大翻译技术普及力度,培养复合型翻译人才,通过跨学科融合协作不断推动翻译技术迭代升级。
获取《蓝皮书》全文:扫码关注百度翻译服务号,后台回复关键词蓝皮书,添加小助手,即可获取。











百度翻译服务号

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存